OpenAI y Broadcom presentan Jalapeño, un chip diseñado para acelerar la inferencia de modelos de lenguaje

por Manuel Naranjo Hace 3 horas

OpenAI ha dado un paso que veníamos viendo desde hace tiempo en el mundo de la infraestructura de inteligencia artificial: meterse de lleno en el diseño de chips propios. La compañía ha presentado junto a Broadcom su primer acelerador de hardware pensado específicamente para la inferencia de grandes modelos de lenguaje, bautizado como Jalapeño.

El anuncio llega de la mano de los máximos responsables de ambas compañías. El chip fue entregado al CEO de OpenAI, Sam Altman, y al presidente Greg Brockman, por parte del CEO de Broadcom, Hock Tan, y su presidente, Charlie Kawwas. Más allá del simbolismo del momento, el movimiento confirma que OpenAI quiere controlar cada capa de su infraestructura, desde los modelos hasta el silicio que los ejecuta.

Un chip diseñado desde cero para inferencia, no adaptado de otros usos

Lo primero que destaca OpenAI sobre Jalapeño es que no se trata de un acelerador genérico reconvertido para tareas de IA, sino de un diseño construido desde el primer boceto pensando exclusivamente en la inferencia de modelos de lenguaje actuales y futuros. La compañía afirma que el chip está informado por los sistemas que ya opera a diario en ChatGPT, Codex, la API y los futuros productos agénticos.

Según OpenAI, las pruebas tempranas indican que este primer acelerador ofrecerá un rendimiento por vatio sustancialmente superior al estado del arte actual, aunque la compañía aclara que todavía está midiendo el rendimiento final y que publicará un informe técnico detallado en los próximos meses. La arquitectura busca reducir el movimiento de datos y equilibrar cómputo, memoria y redes para acercar la utilización real al máximo teórico del chip.

Las muestras de ingeniería del chip ya están funcionando en laboratorio a la frecuencia y potencia objetivo de producción, ejecutando cargas de trabajo de aprendizaje automático que incluyen el modelo GPT-5.3-Codex-Spark.

Nueve meses de diseño a producción, con ayuda de sus propios modelos

Uno de los datos más llamativos del anuncio es la velocidad de desarrollo. OpenAI y Broadcom afirman haber llevado Jalapeño desde el diseño inicial hasta el tape-out de fabricación en solo nueve meses, un plazo que las compañías describen como el ciclo de desarrollo de ASIC más rápido logrado hasta ahora en semiconductores avanzados de alto rendimiento.

Esa velocidad se explica, según OpenAI, por la combinación de un desarrollo conjunto de software y hardware con los equipos de ingeniería de la compañía, la experiencia de Broadcom en implementación de silicio y el uso de los propios modelos de OpenAI para acelerar partes del proceso de diseño y optimización. Es decir, los modelos que la compañía pone a disposición de sus usuarios habrían participado también en el diseño del hardware que los ejecutará en el futuro.

Una plataforma de varias generaciones, construida con socios

Jalapeño no se presenta como un proyecto aislado, sino como el primer eslabón de lo que OpenAI y Broadcom describen como una plataforma de cómputo de varias generaciones. En ese desarrollo participa también Celestica, encargada de la integración de placas, sistemas de rack y producción a escala.

La hoja de ruta contempla un despliegue inicial a finales de 2026, con expansión en los años siguientes. Según Hock Tan, la colaboración permitirá desplegar centros de datos a escala de gigavatio junto a Microsoft y otros socios a partir de ese mismo año. Broadcom aporta a la plataforma, además de la implementación del silicio, su tecnología de redes Tomahawk, pensada para sostener la conectividad de estos sistemas a gran escala.

Richard Ho, responsable del programa de hardware de OpenAI, ha explicado que el chip se optimizó en torno a los kernels, los patrones de movimiento de memoria, las redes y los esquemas de servicio que más afectan al rendimiento de los modelos de frontera. Según sus palabras, las pruebas iniciales muestran que Jalapeño ejecutará las cargas de trabajo más relevantes de la compañía cerca de los límites teóricos del hardware.

El argumento de fondo: abaratar la inferencia para llegar a más gente

OpenAI enmarca todo este desarrollo dentro de lo que llama su estrategia de infraestructura de pila completa: no se limita a desarrollar modelos o construir productos sobre ellos, sino que también diseña la arquitectura de chips, los kernels, los sistemas de memoria, las redes, la planificación de cargas y los sistemas de despliegue. La idea, según la compañía, es que cada capa se pueda optimizar con el mismo objetivo: hacer los modelos más rápidos, más fiables y más baratos de operar.

Greg Brockman ha resumido la lógica detrás del movimiento señalando que el mundo se dirige hacia una economía impulsada por el cómputo, y que Jalapeño forma parte de una estrategia de infraestructura a largo plazo orientada a hacer ese cómputo más abundante. Según Brockman, diseñar más capas de la pila tecnológica internamente permite a OpenAI ofrecer más inteligencia con mayor eficiencia.

Por el momento, ni OpenAI ni Broadcom han detallado el precio de estos sistemas, ni han confirmado qué clientes concretos, más allá de Microsoft, formarán parte del despliegue a escala de gigavatio previsto para 2026. Tampoco se han facilitado cifras de rendimiento definitivas, algo que ambas compañías han dejado para el informe técnico que prometen publicar en los próximos meses.

Fin del Artículo. ¡Cuéntanos algo en los Comentarios!